基于 深度 学 习 的 无 碰撞 引力 N 体 数值 模拟 的 可 行 性 研究 


RIR, BR, Ehk, AF, ARE, WRA, mA 
(1， 中 国 科学 院 云南 天 文 台 ， 云 南 昆明 650216; 2. 中 国 科 学 院 大 学 ， 北 京 100049; 3. 中 国 科 
学 技术 大 学 物理 学 院 ， 安 徽 合肥 230026) 


摘 要 : 本 文 提出 ， 用 深度 神经 网 络 代替 快速 传 里 叶 变 换 法 ， 求 解 无 磁 撞 引力 N 体 数值 模拟 
方法 PM-Tree 中 的 势能 ， 以 提升 PM-Tree 方 法 的 效率 ， 验 证 深度 学 习 方法 加 速 无 碰撞 引力 N 体 数值 
模拟 的 可 行 性 。 无 碰撞 引力 N 体 数值 模拟 对 研究 星系 、 瞳 物质 尝 以 及 宇宙 大 尺度 结构 的 形成 和 演 
化 都 有 重要 意义 。 而 无 碰撞 引力 N 体 数值 模拟 的 传统 方法 在 大 规模 问题 上 的 模拟 计算 非常 耗 时 ， 
其 中 常用 的 PM-Tree 方 法 的 主要 耗 时 部 分 是 求解 势能 〈 解 Poisson 方 程 ) 。 本 文 提 出 使 用 深度 神 
经 网 络 代替 传统 方法 加 速 求解 Poi sson 方 程 ， 多 次 调整 并 训练 和 测试 深度 神经 网 络 模型 结构 ， 最 
终 选 用 了 辅 以 残 差 网 络 局 部 结构 的 Encoder-Decoder 整 体 结 构 。 验 证 了 深度 神经 网 络 解 Poisson 
方程 的 计算 时 间 复 杂 度 为 O(N); 同样 数据 下 进行 测试 ， 速 度 快 于 快速 传 里 叶 变 换 方法 求解 和 有 
限 差分 法 求解 ; 在 同等 采样 率 的 情况 下 ， 精 度 优 于 快速 传 里 叶 变 换 方 法 求解 ; 并 且 具 有 可 扩展 
性 。 故 无 碰撞 引力 N 体 数值 模拟 中 ， 用 深度 神经 网 络 可 以 提升 PM-Tree 方 法 中 求解 势能 的 速度 ， 
从 而 有 效 提升 整体 模拟 速度 。 
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引力 N 体 模拟 是 研究 星系 、 暗 物质 晕 以 及 宇宙 大 尺度 结构 等 天 文系 统 的 形成 和 演化 的 主要 方 
法 之 一 。 由 于 引力 是 长 程 力 ， 对 于 星系 以 及 更 大 尺度 或 更 多 粒子 数 的 引力 系统 ， 可 以 把 其 成 员 
恒星 (或 暗物质 粒子 〉 的 运动 看 作 是 在 总 体 的 引力 势 下 的 运动 ， 而 不 需要 考虑 恒星 之 间 (或 暗 
物质 粒子 之 间 ) 的 相互 作用 〈 即 “碰撞 ”) ， 此 即 无 碰撞 引力 系统 的 概念 ， 也 即 是 一 种 平均 场 近 
似 的 思想 。 对 这 类 系统 随时 间 演 化 的 N 体 数值 模拟 ， 可 不 考虑 “N 体 ”粒子 两 两 之 间 的 引力 作用 ， 
而 仅 需 计算 共同 的 引力 场 〈( 即 解 Poisson 方 程 ) ， 以 及 该 引力 场 对 具体 粒子 的 作用 ， 此 即 无 碰撞 
引力 N 体 数值 模拟 "。 在 近来 的 应 用 中 (Gadget-3, Gadget-4) ，PM-Tree 方 法 是 无 碰撞 引力 N 体 
模拟 的 主要 方法 之 一 , 而 PM-Tree 方 法 中 求解 势能 ( 解 Poisson 方 程 ) 的 步骤 是 主要 耗 时 的 部 分 ”。 
所 以 求解 Poisson 方 程 的 速度 是 影响 无 碰撞 引力 N 体 数值 模拟 耗 时 的 主要 因素 之 一 。 

在 具体 的 引力 N 体 模拟 中 ，“N 体 ”粒子 的 数目 N 不 一 定 对 应 ,往往 不 可 能 达到 恒星 或 暗物质 
粒子 的 真实 数量 ， 数 目 N 的 设 定 ， 取 决 于 模拟 精度 的 需求 以 及 计算 能 力 。 传 统 无 碰撞 引力 N 体 数 
值 模拟 方法 的 计算 速度 ， 现 在 适用 于 模拟 粒子 数 规模 在 10-10" 之 间 的 宇宙 系统 "。 模 拟 更 大 规 
模 的 宇宙 系统 的 分 布 演化 则 需要 计算 速度 更 快 的 方法 。 而 深度 神经 网 络 在 诸多 解 方 程 问题 中 都 
被 证 明 有 效 ， 并 且 还 有 速度 快 的 特点 ， 所 以 我 们 提出 ， 在 传统 无 碰撞 引力 N 体 数值 模拟 方法 
PM-Tree 中 ， 使 用 深度 神经 网 络 代替 快速 傅 里 变换 法 计算 主要 耗 时 的 求解 势能 部 分 〈 解 Poisson 
方程 ) 。 以 粒子 数 规模 为 10 的 系统 为 例 ， 用 深度 神经 网 络 的 方法 ， 单 次 势能 求解 的 速度 理论 上 
能 快 40 倍 左右 ， 循 环 县 加 以 后 对 整体 模拟 的 加 速 较 为 可 观 。 并 且 从 各 方面 说 明了 深度 神经 网 络 
加 速 求解 Poisson 方 程 的 有 效 性 ， 为 后 续 加 速 无 碰撞 引力 N 体 数值 模拟 的 研究 打下 基础 。 而 且 因 
为 深度 神经 网 络 具 有 可 扩展 性 的 特点 ， 所 以 在 其 他 需要 求解 Poisson 方 程 的 物理 问题 中 , 我们 提 
出 的 深度 神经 网 络 模型 也 能 适用 。 

引力 N 体 数值 模拟 方法 : 其 一 ，Particle-to-Particle(PP) 方 法 ,直接 计算 粒子 间 的 牛顿 引 
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力作 用 ,计算 时 间 复 杂 度 为 0CN?)""。 其 二 ， 当 系统 中 粒子 数量 较 多 时 ， 可 以 使 用 自 1980 年 代 延 
用 至 今 的 Tree 代 码 加 快 模拟 速度 “”。Tree 代 码 使 用 递归 方式 计算 子 树 ， 所 以 省 去 了 重复 计算 ， 
将 引力 N 体 数值 模拟 的 计算 时 间 复 杂 度 降低 到 了 O(Nlog(N))， 例 如 有 GASOLINE™”，iVINE" 等 应 
用 。 其 三 ， 有 Particle Mesh (PM) 方 法 : 首先 使 用 Cloud-In-Cell (CIC) 方 法 将 粒子 的 位 置信 息 转 
换 为 均匀 网 格 的 密度 信息 , 然后 通过 快速 传 里 叶 变换 (FFT) 方法 来 求解 基于 这 些 网 格 的 Poisson 
方程 。 该 方法 的 计算 时 间 复 杂 度 为 0(Nlog(N))”"，N 代 表 网 格 单元 数 。 其 四 ， 为 了 提高 PM 方法 中 
网 格 内 模拟 粒子 的 精确 率 , 在 网 格 内 使 用 Tree 代 码 来 计算 粒子 间 的 相互 作用 , 称 为 PM-Tree 方 法 
外 。 由 于 Tree 代 码 每 次 在 PM 方法 的 一 个 小 步 又 内 并 行 计算 ， 而 且 一 次 Tree 代 码 计 算 时 间 小 于 或 
等 于 PM 方法 中 一 个 小 步骤 的 二 分 之 一 计算 时 间 ", 所 以 PM-Tree 方 法 的 计算 时 间 复 杂 度 和 PM 方法 
相同 ， 为 O(Nlog(N))。 至 今 ，PM-Tree 方 法 为 无 碰撞 引力 N 体 数值 模拟 的 主要 方法 之 一 ， 例 如 有 
Gadget-2" 等 应 用 。 最 后 ， 近 年 来 的 N 体 程序 (如 Gadget-3, Gadget-4) “还 实现 了 快速 多 极 子 
方法 (Fast Multipole Method; FMM)“"”。FMM 可 以 将 计算 时 间 复 杂 度 降 到 0(N)， 在 相同 精度 
下 可 以 优 于 Tree 方 法 的 性 能 表现 ， 但 FFM 算 法 更 为 复杂 ， 特 别 是 在 动态 步 长 、 特 殊 边 界 条 件 、 高 
效 并 行 化 等 方面 实现 起 来 较为 困难 。 

以 上 传统 引力 N 体 数值 模拟 方法 的 计算 速度 较 慢 , 在 超大 规模 粒子 数量 问题 中 难以 适用 , 所 
以 需要 速度 更 快 的 方法 。 目 前 深度 神经 网 络 在 很 多 领域 的 成 果 显 著 ”"， 并 且 神 经 网 络 也 常 被 
用 于 解 方 程 ”“。Lagaris 等 证 明了 神经 网 络 能 解 常 微分 方程 和 偏 微分 方程 ”。 引 力 N 体 数值 模 
拟 问 题 中 的 高 维 数据 所 需 计 算 量 巨大 ， 而 卷 积 神经 网 络 的 核心 能 力 就 是 从 高 维 输入 中 提取 多 尺 
度 特征 ””， 这 能 有 效应 对 数值 解 偏 微分 方程 中 的 维度 诅 吕 问题。 所 以 我 们 提出 采用 深度 卷 
积 神经 网 络 的 方法 ， 在 无 碰撞 引力 N 体 数值 模拟 方法 PM-Tree 中 ， 代 蔡 快 速 傅 里 叶 变 换 法 ， 更 快 
求解 势能 〈 解 Poisson 方 程 ) 。 


1 ”相关 工作 


近 几 年 出 现 了 一 些 相关 使 用 深度 神经 网 络 求解 偏 微分 方程 的 方法 。 由 无 碰撞 玻 尔 效 曼 方程 
WERE ABE iN Jeans Vie, SYST COCHRAN) Navier-stokes 方 程 具有 相同 的 形式 ， 所 
以 在 这 类 流体 领域 解 Navier-stokes 方 程 的 相关 研究 结论 也 适用 于 引力 N 体 数值 模拟 “”。 稳 定 流 
近似 是 一 个 Navier Stokes 流 体 问题 , 是 一 种 难以 计算 旦 非 常 耗 时 的 迭代 过 程 ，Guo 使 用 卷 积 神经 
网 络 实现 了 快速 准确 的 拟 合 “”。Zhu 等 在 随机 多 孔 介 质 流 动 问题 中 使 用 卷 积 神经 网 络 , 仅 用 很 少 
的 数据 就 得 到 了 很 好 的 效果 , 优 于 蒙特 卡 洛 法 。Saakaar 等 证 明了 在 流 场 预测 问题 上 使 用 卷 积 
神经 网 络 方法 的 有 效 性 ， 而 且 速 度 比 Reynolds Averaged Navier-stokes 法 快 ””。Khoo 等 证 明了 
神经 网 络 可 以 简洁 地 解 具 有 不 确定 性 的 偏 微分 方程 问题 人。Adler 等 在 i11-posed 逆 问题 上 证 明 
使 用 深度 神经 网 络 迭 代 求 解 ， 速 度 提升 十 分 显著 。 

不 过 这 类 用 深度 神经 网 络 求解 偏 微分 方程 的 方法 是 将 求解 算 子 参 数 化 , 并 不 直接 , 而 且 对 于 
网 格 化 尺寸 不 具有 和 鲁 棒 性 ， 但 对 于 引力 N 体 粒子 数值 模拟 来 说 ， 将 要 处 理 的 问题 是 不 停 迭 代 的 ， 
需要 更 简单 高 效 的 求解 方法 。 而 最 近 出 现 了 一 些 针 对 特定 问题 直接 求解 偏 微分 方程 的 方法 。Wei 
Tang 等 在 电磁 领域 求解 二 维 图 像 形式 的 Poisson 方 程 ， 得 到 了 很 好 的 效果 。Weinan 等 提出 了 
Deep Ritz 方 法 ， 在 使 用 Ritz 方 法 求解 偏 微分 方程 过 程 中 使 用 深度 神经 网 络 来 寻找 Ritz 法 的 解 ， 
证 明了 深度 神经 网 络 的 方法 优 于 有 限 差分 法 ””。Kaushik 等 在 无 限 维 空间 中 证 明了 用 深度 神经 网 
络 参数 化 求解 椭圆 偏 微分 方程 问题 的 有 效 性 和 收敛 性 ”。Smith 等 创作 了 一 个 BikoNet, 证 明 深 度 
神经 网 络 的 万 法 能 够 稳定 求解 Bikonal 方 程 ， 并 能 应 用 到 各 种 领域 , 旦 具有 非常 显著 的 计算 速度 
优势 ”。 


2 本文 工作 及 贡献 


我 们 结合 目前 深度 学 习 的 特点 : 速度 快 、 有 效 解决 高 维度 问题 、 能 求解 偏 微分 方程 等 ， 提 
出 使 用 深度 神经 网 络 代 蔡 快 速 侍 里 叶 变 换 方法 ， 求 解 无 碰撞 引力 N 体 数值 模拟 方法 PM-Tree 中 的 
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势能 〈 解 Poisson 方 程 ) 。 这 种 方法 理论 上 可 以 更 快 地 完成 大 规模 的 无 碰撞 引力 N 体 数值 模拟 。 
并 且 它 的 可 扩展 性 好 ， 易 于 实现 。 我 们 搭建 好 的 深度 神经 网 络 模型 ， 以 及 对 应 的 训练 和 测试 代 
码 都 在 G6ithub 中 开源 ， 项 目地 址 : 

https://github. com/hi76/Poisson-slover-based-on-Encoder-Decoder-Neural-Network 


3 方法 


N 体 数值 模拟 最 早 的 直接 求解 法 耗 时 巨大 。 平 均 场 近似 思想 将 难 解 的 N 体 数值 模拟 转化 为 一 
个 近似 的 统计 问题 ， 更 易 求解 ， 但 速度 依然 不 快 ， 后 来 陆续 出 现 了 一 些 优化 的 方法 ， 如 PM 方 法 、 
PM-Tree 方 法 、 FMM 方 法 等 。 其 中 PM-Tree 方 法 相 比 于 其 他 大 多 数 N 体 数值 模拟 方法 ， 有 速度 快 、 

精度 高 的 优点 ， 所 以 是 目前 主流 的 方法 之 一 。 在 PM-Tree 方 法 中 主要 耗 时 的 步 又 是 求解 势能 CHF 
Poisson 方 程 ) 。 我 们 提出 用 深度 神经 网 络 模型 代替 快速 全 里 时 变换 法 ， 加 速 PM-Tree 方 法 中 势 
能 的 求解 ， 以 验证 深度 学 习 方 法 在 加 速 无 碰撞 引力 N 体 数值 模拟 中 的 可 行 性 。 
3.1 AN 体 数值 模 所 

在 物理 学 和 天 文学 中 ， 在 一 些 物理 作用 力 的 影响 下 ， 对 一 个 由 粒子 组 成 的 系统 的 动力 学 模 
拟 称 为 N 体 模拟 。 引 力 N 体 模拟 主要 是 对 和 N 粒 子 引 力 相 互 作用 方程 求 数值 解 。 引 力 N 体 模拟 在 
天 体 物 理学 中 是 一 个 常用 的 工具 ， 在 少 体系 统 到 宇宙 大 尺度 结构 ， 比 如 地 球 -月 球 -太阳 系统 到 
银河 系 中 都 有 应 用 。N 粒子 引力 相互 作用 方程 为 *: 


3 mm (7,-7T,) > 
F; = 一 gm) FoF), i= Lont) 
j+i rni 


这 里 G = 6.67300-1071 |m3 |kgt |s], Dey AIRAA. 
N 粒 子 引 力 相 互 作用 系统 定义 了 一 个 6N+1 维 的 相 空间 , 这 个 相 空 间 中 每 个 时 刻 每 个 粒子 都 由 
N 个 位 置 和 速度 矢量 确定 。 这 个 方程 的 解 则 是 相 空间 中 的 一 个 运动 轨迹 。 直 接 求 解 这 个 方程 十 分 
耗 时 ， 所 以 需要 简化 的 数值 方法 求解 。 
3. 2 平均 场 法 
平均 场 法 是 出 现 较 早 的 一 种 N 体 数值 模拟 的 方法 。 用 统计 方法 来 描述 引力 N 体 问题 时 ， 系 统 
SY AGF (XLV Mt) 描述 了 粒子 的 全 部 信息 。 当 不 考虑 粒子 间 的 关联 ， 即 认为 
fO (41,V1,X2,V2,t) = 中 (X50t)f 中 (xz,v2,t)， 此 即 平均 场 近似 ， 即 无 碰撞 N 体 系统 。 平均 场 近似 
中 ， 粒 子 受到 的 作用 力 取决 于 分 布 函 数 ， 而 不 必 计 算 粒 子 两 两 之 间 的 引力 相互 作用 ， 这 时 我 们 
可 用 单 粒子 分 布 函 数 fxvt) 来 构造 系统 的 平均 场 描述 ， 即 在 dq3xd3v 大 小 的 6 维 相 空间 中 ， 发 现 
一 个 粒子 的 概率 为 f(x%v,t)d3xd3v。 这 个 分 布 函数 的 演化 可 以 由 无 碰 杠 玻 尔 兹 曼 方 程 来 描述 R", 
aa of ala 3dr F680) 
ðt Ox dx aD 
ATER LE BEA a A Bh eee BAYAN: 
Pr = O,,,.(%,t) + Pt#(3) 
这 个 内 部 势能 即 所 有 N 体 粒子 的 引力 势能 所 构成 的 共同 的 自 引力 势 , 可 基于 所 有 粒子 的 密度 
分 布 p(7,t)， 通 过 求解 Poisson 方 程 得 到 : 
V*@(%,t) = 4nGp(7,t) #(4) 
这 里 p(t) = [ff(%5t)q3v， 即 与 分 布 函数 相对 应 的 该 系统 的 密度 分 布 。 平 均 场 法 将 难 解 的 
N 体 问题 转换 为 一 个 近似 的 统计 问题 ， 使 其 更 易 求 解 。 但 它 的 直接 计算 比较 耗 时 ， 所 以 后 来 陆续 
出 现 了 很 多 优化 的 方法 ， 如 PN 方法 "等 。 
3.3 PM-Tree 
PM-Tree 方 法 也 是 一 种 N 体 数值 模拟 的 方法 。 它 在 PM 方法 的 网 格 内 加 入 Tree 代 码 以 实现 更 精 
的 模拟 。 因 其 速度 较 快 且 精 度 较 高 的 特点 ， 在 最 近 的 N 体 数值 模拟 应 用 中 ， 常 以 PM-Tree 方 法 
为 主 进行 模拟 ”。PM-Tree 方 法 在 每 个 时 间 步 长 (取决 于 模拟 的 时 间 区 间 ， 以 及 模拟 的 精度 要 求 ) 
内 模拟 的 基本 步 又 可 以 概括 为 ”: 
(1) 首先 确认 Tree 代码 应 用 的 网 格 以 及 当中 的 粒子 ， 除 此 以 外 的 粒子 只 由 PM 方 法 来 模拟 计 
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算 。 
(2) 运行 PM 方法 的 一 半 步 又 。 
(3) 计算 每 个 Tree 代码 应 用 的 网 格 对 应 的 外 部 总 势能 一 一 其 余 网 格 对 它 的 势能 和 。 
(4) 对 这 些 应 用 的 网 格 使 用 Tree 代码 同时 计算 ， 并 将 计算 结果 加 入 到 正在 运行 的 PM 方 法 步 

又 中 。 
(5) 计算 PM 方 法 中 的 势能 以 及 对 应 每 个 粒子 的 加 速度 。 
(6) 将 每 个 Tree 整合 到 PM 方 法 的 最 后 步 又 。 
(7) 更 新 粒子 速度 和 位 置信 息 。 再 从 (1) 步骤 开始 循环 计算 。 
因为 在 PM-Tree 方 法 步骤 中 ， Tree 代 码 是 和 PM 方法 并 行 计算 的 ， 并 且 每 次 Tree 代码 计算 所 需 
时 间 不 大 于 PM 方 法 每 次 计 入 FEN 的 一 半 , 所 以 PM-Tree 方 法 耗费 的 时 间 主 要 为 PM 方 法 步骤 耗费 的 
时 间 。 在 PM 方 法 中 ， 求 解 势能 是 主要 耗 时 的 计算 步 又， 而 势能 需要 求解 Poisson 方 程 得 到 。 所 以 
加 速 PM-Tree 方 法 的 关键 点 在 于 加 速 求解 Poisson 方 程 。PM-Tree 方 法 的 应 用 中 ,常用 快速 傅 里 叶 
变换 法 求解 Poisson 方 程 ”。 本 文 提 出 用 深度 神经 网 络 代 蔡 快 速 傅 里 叶 变 换 法 求解 PM-Tree 方 法 
中 的 所 有 Poisson 方 程 ， 以 加 束 PM-Tree 方 法 ， 也 即 是 加 速 N 体 数值 模拟 。 
3.4 Poisson 方 程 数值 求解 

传统 求解 Poisson 方 程 的 方法 有 : 有 限 元 法 、 有 限 差 分 法 、 有 限 体积 法 、 快 速 傅 里 叶 变换 求 
解法 等 。 利 用 计算 机 数值 求解 Poisson 方 程 ， 首 先 要 将 Poisson 方 程 转 为 代数 方程 ， 即 差分 方程 。 
二 维 Poisson 方 程 的 差分 方程 表示 为 : 

Pitt + Pi-1; + ui + Pij-1 49ij = AnGp;;#(S5) 

分 子 即 是 对 做 卷 积 ， ee AR (5) 在 计算 机 中 的 操作 可 以 简化 表示 为 ， 生 

成 的 势能 mw 和 一 个 二 阶 差分 算 子 V 的 卷 积 


fo 1 0 
1 =4 | 
4r6p = 0 10 9 0#(6) 


四 是 卷 积 操作 符 ， 这 里 卷 积 操作 符 的 左边 项 即 是 二 阶 差分 算 子 VY。 有 限 差 分 法 求解 Poisson 
方程 ， 是 将 公式 G) 全 部 展开 为 一 个 有 解 的 线性 方程 组 ， 再 用 各 类 迭代 法 求解 。 有 限 差分 法 求 
解 Poisson 方 程 的 计算 时 间 复 杂 度 为 O(N?) 2 。 
快速 傅 里 叶 变换 方法 CFFT) ， 利用 储 里 叶 变 换 ， 将 实数 域 中 的 卷 积 转换 为 复数 域 的 乘法 ， 
进而 将 公式 〈6) 转换 为 一 个 复数 域 中 易 解 的 方程 ， 求 解 后 再 做 传 里 叶 逆 变 换 ， 即 得 Poisson 方 
程 的 数值 解 ”w。 快 速 全 里 叶 变 换 求解 方法 的 计算 时 间 复 杂 度 为 0(NlogN)。 因 其 速度 较 快 ， oe 
来 的 引力 N 体 数值 模拟 应 用 (Gadget-3, Gadget-4 等 ) 中 ， 涉 及 到 求解 Poisson 方 程 的 步骤， 

也 是 用 快速 傅 里 叶 变 换 方法 进行 求解 ”。 


三 维 Poisson 方 程 的 二 阶 差分 算 子 V 为 : 

0 0 0 0 1 0 0 0 0 

0 1 0|, |1 -6 1|, JO 1 0 
| 0 0 i an 1 f 0 0 #(7) 
Pe asi 三 维 Poisson 方 程 的 原理 和 过 程 与 二 维 相 同 , 只 是 二 阶 差 分 算 子 V 不 同 , 计算 量 更 大 

。 我 们 的 目标 是 训练 一 个 深度 神经 网 络 ， 以 0(N) 的 计算 时 间 复 杂 度 ， 实 现 求 解 公式 (6) 
ka E EUER EI A A AR E E EET ER Poisson Fe, FEIN AE 
撞 引 为 N 体 数值 模拟 的 可 行 性 。 因 为 我 们 关注 的 问题 为 : 深度 神经 网 络 是 否 可 以 实现 求解 公式 (6) 
的 反 卷 积 过 程 。 所 以 我 们 选用 消耗 计算 资源 更 少 的 二 维 Poisson 方 程 进行 验证 即 可 。 
目前 N 体 数值 模拟 的 粒子 数 规模 主要 在 10-10"* 之 间 。 随 着 计算 机 计算 能 力 的 提升 ， 能 够 模 
拟 的 粒子 数 规模 以 每 年 两 倍 左右 增长 ， 符 合 摩尔 定律 。 在 无 碰撞 引力 N 体 数值 模拟 中 ， 影 响 模拟 
速度 的 主要 因素 为 解 Poisson 方 程 的 速度 ， 传 统 方法 中 常用 的 FFT 求 解 的 计算 时 间 复 杂 度 为 
O(Nlog(N))" 而 我 们 提出 的 深度 神经 网 络 模 型 的 计算 时 间 复 杂 度 为 OCN), 以 粒子 数 规模 为 10” 
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为 例 ， 每 一 次 Poisson 方 程 求解 的 速度 理论 上 能 快 40 信 左右。 在 PM-Tree 方 法 中 ， 求 解 Poisson 
方程 的 步骤 需要 循环 执行 很 多 次 ， 所 以 循环 壹 加 以 后 ， 计 算 时 间 复 杂 度 O(CN) 的 方法 对 无 碰撞 引 
力 N 体 数值 模拟 的 加 速 将 较为 可 观 。 而 且 随 着 将 来 模拟 的 粒子 数 规模 不 断 增 大 , 计算 时 间 复 杂 度 


O(N) 的 方法 所 能 节省 的 模拟 时 间 也 会 更 加 明显 。 
3.5 深度 神经 网 络 模 型 


深度 神经 网 络 具 有 非常 强 的 高 维特 征 提取 能 力 。 在 深度 神经 网 络 内 部 ， 是 一 个 非常 高 维 的 


棒 性 。 而 二 维 数据 变 为 三 维 数据 ， 相 对 于 深度 神经 网 络 内 部 非常 高 维 的 特征 空间 ， 


特征 空间 ， 所 以 一 个 复杂 的 深度 神经 网 络 模型 ， 对 于 变化 不 是 过 于 剧烈 的 输入 数据 ， 都 具有 重 


不 是 巨大 的 


变化 。 而 且 即 使 数据 复杂 度 变 化 较 大 ， 只 要 特征 原理 不 变 ， 深 度 神经 网 络 也 可 以 
型 的 复杂 度 ， 而 维持 原 有 的 效果 ””。 所 以 我 们 的 主要 目标 是 验证 深度 神经 网 络 和 


目 应 地 增加 模 
E 够 实现 求解 


AR (6) 的 反 卷 积 过 程 。 我 们 前 后 实验 了 数 十 种 网 络 结构 用 于 快速 求解 Poisson 方 程 ， 最 终 找 
到 了 目前 效果 最 好 的 网 络 结构 。 因 为 在 机 器 翻译 中 ， 将 一 种 语义 转化 为 男 一 种 语义 的 端 到 端的 


神经 网 络 结构 采用 较 多 的 是 Encoder-Decoder 结 构 ””， 这 与 公式 (4) HHOGt) Spc 


FORMA 


类 似 之 处 ， 所 以 我 们 采用 Encoder-Decoder 这 样 的 总 体 架构 。 网 络 基础 模块 借鉴 ResNet “结构 ， 
第 一 种 将 一 个 卷 积 层 的 输入 与 它 的 输出 相 加 (〈 残 差 卷 积 结构 ) ， 另 一 种 将 一 个 卷 积 转 置 层 的 输入 
与 它 的 输出 相 加 ( 残 差 反 卷 积 结构 ) 。 为 了 保证 输入 mn 大 小 尺 才 的 模拟 分 布 图 p， 能 够 得 到 同样 大 


小 尺寸 的 模拟 势能 图 小 ， 我 们 采用 了 完全 对 称 的 网 络 结构 ， 前 半 段 使 用 一 次 卷 积 ， 


趴 ， 连 续 三 次 。 然 后 做 通道 数 不 变 的 卷 积 与 反 卷 积 , 用 于 提取 图 像 的 高 维特 征 。 后 站 
残 差 反 卷 积 ， 一 次 卷 积 ， 连 续 三 次 ， 用 于 将 高 维特 征 表达 为 需要 的 势能 分 布 ， 如 图 


一 次 残 差 郑 
EL 段 使 用 一 次 


1 所 示 。 其 中 


所 有 的 卷 积 层 或 者 反 卷 积 层 的 核 大 小 为 3、 步 长 为 1、 填 充 大 小 为 1。 激 活 函 数 均 采用 ReLU 函 数 外 


套 一 层 线性 函数 。 


256 256 


为 激活 函数 ， 右 侧 蓝 色 为 反 卷 积 层 ， 黄 色 为 激活 函数 。 


1 神经 网 络 模型 结构 。 数 字 是 卷 积 层 通道 数 ， 左 侧 向 下 代表 特征 提取 部 分 ， 右 侧 向 上 代表 上 采样 部 分 。 左 侧 绿色 为 卷 积 层 ， 红 色 


Fig. 1 Neural network model Structure. The numbers are convolutional channels, with the left side down for feature extraction and the right 


side up for up-sampling. On the left side, green is the convolutional layer, red is the actication function, on the right si 
convolutional transpose layer, yellow is the activation function. 


我 们 的 训练 目标 是 最 小 化 预测 值 和 势能 真 值 的 平均 平方 误差 : 
MSE = Ppredict 一 )*#(8) 


使 用 最 大 差 值 绝对 值 来 评估 误差 : 
error = Max|Predict 一 中 |#(9) 


de, blue is the 
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卷 积 神经 网 络 模型 的 计算 时 间 复 杂 度 为 ”: 


l=1 


这 里 ! 是 卷 积 层 索 引 ，q 是 网 络 深度 ， 


0 (5 na's? n: ni) #(10) 


mn 是 第 ! 层 的 卷 积 核 数量 , nj_1 是 第 ! 层 的 输入 通道 数 。s， 


是 卷 积 核 尺寸 ，m1 是 输出 特征 图 尺寸 ， 


N 等 于 最 后 一 层 的 输出 特征 图 尺寸 m2。 由 于 神经 网 络 模 


型 中 间 参 数量 固定 ， 且 通常 无 碰撞 引力 N 体 数值 模拟 中 的 N >> Ldnysim (l + d), MARIA 


网 络 模型 的 计算 时 间 复 杂 度 为 0(N)。 本 


4 ”训练 模型 


我 们 的 目标 是 : 用 深度 神经 网 络 代 替 快 速 傅 里 叶 变 换 法 ， 求 解 PM-Tree 方 法 中 的 势能 ( 解 
Poisson 方 程 》， 以 验证 深度 学 习 加 速 无 碰撞 引力 N 体 数值 模拟 的 可 行 性 。 其 中 关键 任务 是 验证 


深度 神经 网 络 是 否 可 以 实现 求解 公式 ( 
Poisson 方 程 求解 器 的 深度 神经 网 络 模型 。 


文 实验 也 进一步 证 明了 神经 网 络 模型 为 线性 复杂 度 的 函 


6) 中 的 反 卷 积 过 程 ， 所 以 需要 训练 得 到 一 个 可 以 作为 
!4。 使 用 随机 生成 的 矩阵 模拟 网 格 化 后 需要 预测 的 势能 几 ， 


即 是 Poisson 方 程 的 数值 解 。 对 生成 图 像 做 二 阶 差 分 得 到 模拟 的 输入 分 布 p。 建 立 一 个 深度 神经 


网 络 模型 ， 以 多 个 卷 积 层 来 提取 特征 ， 
据 图 ， 用 平均 平方 误差 对 这 个 深度 神经 
用 于 简单 等 时 势 问 题 进行 评估 、 并 和 快 
以 及 有 限 差分 法 做 时 间 对 比 、 用 于 多 种 
4.1 数据 集 


多 个 反 卷 积 层 来 表达 特征 输出 预测 势能 。 生 成 百 万 张 数 
网 络 模型 进行 训练 。 最 后 对 训练 好 的 模型 做 精度 测试 、 
速 傅 里 叶 变换 方法 做 精度 对 比 、 和 快速 传 里 叶 变换 方法 
网 格 化 方式 进行 测试 。 


我 们 生成 一 百 万 张 图 作为 训练 集 ， 一 万 张 图 作为 测试 集 。 这 里 我 们 假设 将 求解 区 域 采 样 为 


N x NN 的 网 格 ， 则 使 用 的 数据 中 模拟 势 


一 圈 值 设置 为 0 作为 Dirichlet 边 界 条 件 。 


E98 真 值 的 构成 为 : 随机 生成 的 N x N 和 矩阵 ， 然 后 将 周围 
采用 Dirichlet 边 界 条 件 的 原因 是 : 在 引力 N 体 数值 模 


拟 中 ， 通 常 我 们 所 关注 的 物质 团 周围 很 大 区 域 都 是 真空 ， 可 以 近似 为 0。 并 且 为 了 避免 网 络 训练 
过 于 受到 随机 函数 本 身影 响 (随机 函数 得 到 的 模式 几乎 都 是 不 规律 跳 变 值 , 相同 的 或 平滑 的 情况 
很 少 ) ， 我 们 也 人 为 加 入 了 一 些 特殊 模式 作为 数据 增强 :对 中 间 部 分 区 域 做 高 斯 平滑 、 将 中 间 部 
分 区 域 数值 设置 为 0, 将 四 角 部 分 区 域 数 值 设置 为 0. 99 等 。 这 些 图 像 是 模拟 的 Poisson 方 程 的 解 ， 


也 就 是 势能 分 布 p， 是 深度 神经 网 络 模型 


图 2 全 随机 
Fig.2 Rand 


4 的 预测 目标 ， 加 图 2- 5 所 示 。 
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中 间 平 滑 
Fig. Ai Middle a 
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0.8 0.8 
0.6 0.6 
0.4 0.4 
0.2 0.2 
0.0 0.0 


图 4 中 间 置 0 图 5 四 角 置 0.99 
Fig.4 Middle setting 0 Fig.5 Quadrant setting 0.99 


需要 模拟 求解 的 分 布 p 图 ， 可 由 以 上 模拟 的 势能 8 通过 公式 C6) 得 到 ， 如 图 6-9 所 示 ， 这 些 


分 布 p 图 也 即 是 深度 神经 网 络 模型 的 输入 。 
2 2 
1 
中 0 
-1 
-2 
-2 


图 6 对 图 2 的 二 阶 差分 图 7 对 图 3 的 二 阶 差分 
Fig.6 Second-order differential of Fig.2 Fig. 7 Second-order differential of Fig.3 
2 
2 
0 
0 
一 如 
一 2 
图 8 对 图 4 的 二 阶 差分 图 9 对 图 5 的 二 阶 差分 
Fig.9 Second-order differential of Fig.4 Fig.9 Second-order differential of Fig.5 


每 次 训练 给 深度 神经 网 络 模型 输入 p， 用 模型 输出 与 $ 的 平均 平方 误差 进行 训练 。 因 为 我 们 
的 数据 是 随机 生成 的 ， 所 以 有 不 限 数量 的 训练 数据 的 优点 。 每 一 次 生成 一 百 万 对 数据 用 于 训练 。 
4. 2 训练 参数 

我 们 在 Pytorch 中 实现 深度 神经 网 络 模型 。 每 一 次 训练 使 用 一 百 万 对 数据 ， 批 大 小 设置 为 
100。 优 化 器 选用 Adam”， 学 习 率 从 0.01 视 情况 调整 到 0.000001。 每 一 组 数据 训练 100 次 。 训 练 
使 用 的 GPU 是 Tesla P100。 


5 ”训练 成 果 及 测试 


5. 1 训练 成 果 
输入 模拟 分 布 函数 p 图 ， 通 过 神经 网 络 模型 得 到 预测 图 ， 与 模拟 势能 由 真 值 图 比较 并 作 差 ， 
训练 成 果 由 图 10-13 所 示 。 
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2 0.8 
0.6 
0 
0.4 
=) 0.2 


图 10 模拟 p 图 11 模拟 gp 
Fig.10 Simulationp Fig.11 Simulation $ 
le—4 
0.8 1 
0.6 
0 
0.4 
—1 
0.2 
0.0 me 
图 12 ”预测 值 4 13 ”预测 值 与 模拟 8 的 相对 误差 
Fig.12 Prediction Fig.13 Relative error between prediction and simulation 中 


可 以 看 到 ， 深 度 神 经 网 络 模型 的 预测 图 和 模拟 势能 % 真 值 图 肉眼 几乎 看 不 出 区 别 ， 图 像 特 
征 基本 吻合 ， 它 们 的 相对 误差 最 大 为 2 x 10-4， 精 度 达 到 Poisson 方 程 的 求解 目标 。 
5.2 测试 结果 
使 用 一 万 对 新 生成 数据 用 于 测试 ， 最 大 误差 的 数量 分 布 如 图 14 所 示 ， 以 及 统计 得 到 不 同 最 
大 误差 精度 下 的 准确 率 如 表 1 所 示 。 
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10 m 
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图 14 10000 组 数据 测试 结果 。 横 坐标 为 最 大 误差 ， 纵 坐标 为 数量 
Fig.14 Test results for 10000 sets of data. Horizontal coordinates are maximum error, vertical coordinates are 
quantities 


表 1 不 同 精度 下 的 准确 率 


Tab.2 Accuracy at diferent precision 


Maximum error Accuracy 
<0. 0005 94% 
<0. 001 99% 


<0. 005 99. 9% 
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5.3 不 同 网 格 化 数据 测试 
为 了 验证 模型 的 普 适 性 ， 将 用 16 x 16 数 据 训 练 的 神经 网 络 模型 用 于 渐 增 网 格 化 尺寸 (16 x 
16 一 1024 x 1024) 的 图 像 进行 测试 ， 如 图 15-16 所 示 。 
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图 15 平均 最 大 误差 趋势 图 。 横 坐标 为 网 格 化 尺寸 ， 纵 坐标 为 平均 最 大 误差 
Fig.15 Maximum error trend graph. The horizontal coordinate is the mesh size and the vertical coordinate is the 
average maximum error 
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图 16 “平均 平方 误差 趋势 图 。 横 坐标 为 网 格 化 尺寸 ， 纵 坐标 为 平均 平方 误差 
Fig.16 Mean squared error trend graph. The horizontal coordinate is the mesh size and the vertical coordinate 
is the mean squared error 


可 以 看 出 ， 最 大 误差 趋势 渐 平 ， 不 会 随 网 格 化 尺寸 增 大 而 线性 增 大 。 从 平均 平方 误差 图 更 
能 看 出 ， 随 着 网 格 化 尺寸 增 大 ， 平 均 以 后 的 平方 误差 反而 在 减 小 ， 当 网 格 化 尺寸 足够 大 以 后 ， 
误差 基本 不 变 。 取 其 中 两 个 (256 x 256,1024 x 1024) 如 图 17-24 示 意 。 
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图 17 模拟 256 x 256p 
Fig. 17 Simulation 256 x 256 p 
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19 256x256 预 测 值 
Fig.19 256x256 Prediction 
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图 21 模拟 1024 x 1024 p 
Fig.21 Simulation 1024 x 1024p 
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图 18 模拟 256 x 2569 
Fig.18 Simulation 256 x 2569 
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图 20 ”预测 值 与 模拟 由 的 相对 误差 


Fig.20 Relative error between prediction and simulation 中 


0.8 
0.6 
0.4 
0.2 
0.0 


图 22 模拟 1024 x 1024 $ 
Fig.22 Simulation 1024 x 1024¢ 
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图 23 1024 x 1024 预 测 值 图 24 预测 值 与 模拟 8 的 相对 误差 
Fig.23 1024 x 1024 Prediction Fig.24 Relative error between prediction and simulation 中 


可 以 看 到 ， 用 16 x 16 尺 十 数据 训练 的 网 络 ， 在 更 大 尺度 上 依然 具有 普 适 性 。 经 过 各 种 尺度 
图 像 的 对 比分 析 ， 它 的 最 大 误差 变 大 的 原因 是 更 大 尺寸 的 数据 包含 的 局 部 特殊 模式 更 多 。 而 这 
些 特殊 模式 ， 就 是 在 测试 集 数据 测试 时 出 现 的 那些 误差 较 大 的 点 。 但 总 体 可 以 说 明 ， 小 尺寸 数 
据 训练 的 模型 ， 可 以 用 于 大 尺寸 数据 使 用 。 这 意味 着 模型 训练 的 时 间 成 本 可 以 非常 低 。 
5.4 等 时 势 问 题 测试 

我 们 将 训练 好 的 模型 用 于 一 个 实际 的 物理 问题 ， 等 时 势 问 题 。 直 接 按 公式 (11-12) 生成 等 
时 势 问题 的 p 和 p 图 像 。 


3( + a)a* —r*(b+3a) 
4n(b 十 Q)3a3 
(r) = 一 — OM 4#(12) 
b+ Vb? +r? 
将 p 输 入 到 训练 好 的 深度 神经 网 络 模型 中 进行 测试 ， 得 到 预测 值 ， 将 预测 值 与 模拟 $p 作 差 对 
比 ， 如 图 25-28 所 示 。 


p(r)=M #(11) 
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图 25 模拟 p 


图 26 模拟 四 


Fig.25 Simulationp Fig.26 Simulation $ 
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图 27 网 络 预测 值 图 28 ”网 络 预测 值 与 模拟 8 的 误差 
Fig.27 Network Prediction Fig. 28 Error between Network prediction and simulation 中 


可 以 看 到 ， 在 实际 的 物理 问题 
同样 的 数据 ， 我 们 将 之 用 于 


页 中 ， 深 度 神经 网 络 模 型 依然 可 以 表现 良好 。 
快速 传 里 叶 变 换 方法 求解 ， 以 做 精度 对 比 。 如 图 29-30 所 示 。 


le—2 
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图 29 FFT 求 解 值 


图 30 FFT 求 解 值 与 模拟 四 的 误差 


Fig. 29 FFT Prediction Fig. 30 Error between FFT prediction and Simulation 中 


图 28 和 图 30 对 比 可 以 看 出 ， 
里 叶 变 换 方法 ， 满 足 精 度 要 求 。 


在 同样 采样 率 的 情况 下 ， 深 度 神 经 网 络 模型 的 精度 高 于 快速 傅 


5.5 与 快速 传 里 叶 变 换 方法 及 有 限 差分 法 的 计算 时 间 对 比 


生成 网 格 化 尺寸 逐渐 增长 的 
变换 方法 以 及 有 限 差 分 法 的 计算 


数据 ， 分 别 对 比 测试 训练 好 的 深度 神经 网 络 模型 和 快速 传 里 叶 
时 间 。 测 试 结果 如 图 31-32 所 示 。 


202106.00096v1 


chinaXiv 


0.08 | 
0.06 } Pi 
e° op Fee 
E 0.044 ee N 
+h ev °F ial iain 
hic ail 
0.02 | aire 
a oh sp T 
0.00} a 


图 31 神经 网 络 模型 和 快速 傅 里 叶 变 换 方法 计算 时 间 对 比 。 横 坐标 为 网 格 化 


Fig. 31 Comparison of neural network model and fast Fourier tr 
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红色 代表 快速 傅 里 叶 变 
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尺寸 ， 纵 坐标 为 计算 时 间 ， 单 位 (s) 。 蓝 色 代表 神 
换 方法 。 


ansform computation times. The horizontal coordinates 


are the mesh values and the vertical coordinates is the computation time in unit(s). Blue represents the neural 


network model and red represents t 


he fast Fourier transform. 
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图 32 神经 网 络 模 型 和 有 限 差分 法 计算 时 间 对 比 。 横 坐标 为 网 格 化 尺寸 ， 


黄色 代表 有 限 差分 法 


0. 


8 10 


纵 坐 标 为 计算 时 间 ， 单 位 (s) 。 蓝 色 代 表 神 经 网 络 模 


Fig.32 Comparison between the neural network model and the finite difference method computation times. The 


horizontal coordinates are the mesh values and the vertical coordinates are the computation time in unit(s). Blue 


represents the neural network model, 


实验 结果 可 以 看 出 ， 深 度 神 经 网 络 方法 求解 Poisson 方 程 ， 


速度 快 于 快速 傅 里 叶 变换 方法 以 及 有 限 差 分 法 。 这 归功 于 两 点 ， 


进行 快速 计算 ， 更 重要 的 一 点 是 ， 


从 实验 结果 图 中 可 以 看 


性 增长 的 ， 而 快速 傅 里 叶 变 换 方法 为 Nlog(N) 倍 增长 ， 有 限 差分 


前 文 卷 积 神经 网 络 计 算 时 间 复 杂 度 理 t 


5.6 失败 神经 网 络 模型 结构 概述 
这 里 描述 一 些 试验 结果 差 的 网 络 结构 ， 数 据 生 成 方式 和 上 述 相同 。 第 一 种 是 纯 卷 积 网 络 结 
构 ， 通 道 数 为 : 1 一 128 一 256 — 512 — 256 一 128， 最 后 平均 平方 误差 收敛 到 0.0003， 误 差 较 
大 。 在 第 一 种 网 络 结构 的 中 间 每 个 卷 积 层 后 插入 归 一 化 层 ， 效 果 变 差 ， 平 均 平方 误差 只 能 收敛 
到 0.14。 加 入 一 种 网 络 基础 模块 ， 对 每 次 输入 进行 一 次 卷 积 ， 再 将 卷 积 后 的 输出 与 输入 县 加 作 


为 下 一 层 的 输入 ， 下 一 层 再 通过 卷 积 将 维度 变 


均 平 方 误差 只 能 收敛 到 0. 005。 


从 分 析 相 互 印 证 。 


yellow represents the finite difference method 


随 着 数据 网 格 化 尺寸 增 大 ， 计 介 
一 是 深度 神经 网 络 可 以 利用 GPU 


上 深度 神经 网 络 的 计算 时 间 趋 势 为 线 


法 更 是 倍增 长。 这 个 结论 与 


回 初始 输入 的 维度 ， 效 果 也 不 如 纯 卷 积 网 络 ， 平 


尝试 在 纯 卷 积 网 络 尾 端 加 入 两 层 全 连接 层 ， 不 仅 参 数量 又 增 ， 平 


均 平 方 误差 也 仪 能 达到 0.01。 


再 尝试 将 全 


连接 层 加 到 前 端 


央 以 及 后 端 ， 平 均 平方 误差 能 到 0.0008， 


202106.00096v1 


chinaXiv 


ChinaXiv 合 作 期 刊 


但 参数 量 很 大 ， 训 练 很 慢 ， 且 效果 还 是 不 如 简单 的 纯 卷 积 网 络 。 尝 试 将 纯 卷 积 网 络 中 间 两 层 的 
步 长 改 为 2, 试图 提取 更 精简 的 特征 ， 并 在 随后 后 端的 两 层 将 卷 积 改 为 反 卷 积 进行 上 采样 ,平均 
平方 误差 这 次 降 到 了 10-5， 比 纯 卷 积 网 络 效果 更 好 ， 但 依然 达 不 到 精度 要 求 。 采 用 一 次 卷 积 一 
次 反 卷 积 和 迭代 的 网 络 结构 平均 平方 误差 只 能 到 0.3 。 在 纯 卷 积 网 络 结构 上 ， 加 入 模仿 ResNet 的 网 
络 基础 模块 ， 对 某 次 输入 进行 次 卷 积 ,然后 将 输入 和 输出 相 加 作为 下 一 层 的 输入 ,一 次 卷 积 ， 
一 次 残 差 模块 ， 依 次 6 次 ， 平 均 平 方 误差 能 达到 10-5。 基 于 以 上 网 络 结构 的 试验 ， 最 后 综合 各 种 
结构 的 优 和 劣势， 设计 了 最 终 的 深度 神经 网 络 模型 结构 。 
5.7 有 趣 实验 现象 

我 们 所 给 的 数据 都 是 设置 了 Dirichlet 边 界 条 件 的 数据 , 尝试 了 一 下 不 设置 边界 条 件 会 发 生 
什么 。 用 神经 网 络 模型 对 不 设置 边界 的 16 x 16 数 据 进行 训练 ， 训 练 过 程 和 结果 的 精度 与 给 定 边 
界 条 件 时 的 情况 相似 。 在 同 网 格 化 尺寸 下 训练 结果 的 相对 误差 精度 也 可 以 达到 10“, 但 将 训练 的 
神经 网 络 模型 用 于 更 大 网 格 化 尺寸 的 数据 上 时 ， 就 发 生 了 有 趣 的 现象 ， 它 只 能 预测 到 边缘 16 宽 


度 的 范围 ， 中 间 部 分 几乎 为 零 ， 如 图 33-40 所 示 。 
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33 Simulation 32 x 32 p Fig. i Simulation 32 x 32 
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图 35 32 x 32 预 测 值 图 36 ”预测 值 与 模拟 8 的 相对 误差 

Fig. 36 32x32 Prediction Fig.36 Relative error between prediction and simulation 中 
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Fig.37 Simulation 64x 64p Fig.38 Simulation 64x 64@ 
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39 64 x 64 预 测 值 图 40 ”预测 值 与 模拟 的 相对 误差 


Fig. 39 64x64 Prediction Fig. 40 Relative error between prediction and simulation 中 


结合 神经 网 络 模型 具有 不 同 网 格 化 数据 的 普 适 性 来 分 析 ， 这 样 的 现象 可 能 是 因为 训练 好 的 
神经 网 络 模型 是 局 部 迭代 操作 ， 同 时 又 是 从 边界 开始 向 内 求解 Poisson 方 程 造成 的 。 
5.8 实验 总 结 

综合 以 上 实验 结果 ， 可 以 得 出 : 深度 神经 网 络 模型 具有 快速 求解 PM-Tree 方 法 中 势能 ( 解 
Poisson 方 程 ) 的 能 力 ; 精度 不 低 于 快速 傅 里 叶 变 换 法 ; 速度 优 于 快速 傅 里 叶 变 换 法 和 有 限 差分 
法 , 特别 是 随 着 无 碰撞 引力 N 体 数值 模拟 的 粒子 数 规模 增加 ,深度 神经 网 络 模 型 的 速度 优势 更 加 
明显 ; 在 未 经 训练 的 更 大 网 格 化 尺寸 数据 上 也 能 使 用 ， 具 有 可 扩展 性 。 所 以 深度 学 习 的 方法 在 
加 速 无 碰撞 引力 N 体 数值 模拟 中 是 可 行 的 。 


6 ”结论 


本 文 在 神经 网 络 解 各 类 方程 的 研究 和 几 种 无 碰撞 引力 N 体 数值 模拟 方法 的 基础 上 , 提出 了 用 
一 个 辅 以 残 差 局 部 结构 的 Encoder-Decoder 深 度 神 经 网 络 模型 ， 求 解 PM-Tree 方 法 中 的 势能 〈 解 
Poisson 方 程 ) 代替 常用 的 FFT 求 解 。 验 证 了 深度 神经 网 络 模型 可 以 快速 求解 Poisson 方 程 ; 理论 
上 深度 神经 网 络 的 计算 时 间 复 杂 度 为 0(N); 验证 了 深度 神经 网 络 模型 计算 耗 时 低 于 快速 传 里 叶 
变换 方法 以 及 有 限 差 分 法 ; 验证 了 在 相同 离散 化 采样 率 的 情况 下 深度 神经 网 络 模型 求解 精度 不 
低 于 快速 傅 里 时 变换 方法 ， 验 证 了 深度 神经 网 络 具 有 可 扩展 性 ， 在 小 网 格 化 尺寸 数据 集 上 训练 
的 模型 可 以 应 用 到 大 网 格 化 尺寸 数据 集 上 。 并 且 深 度 神 经 网 络 模型 可 以 更 好 地 利用 GPU 计算 资源 
进行 并 行 处 理 ， 在 粒子 数 规模 较 大 的 情况 下 ， 速 度 优势 更 加 明显 。 综 合 以 上 验证 结果 ， 我 们 提 
出 使 用 深度 神经 网 络 代替 FFT 方 法 求解 PM-Tree 方 法 中 的 势能 〈 解 Poisson 方 程 ) ， 可 以 加 速 
PM-Tree 方 法 中 主要 的 耗 时 步骤 ， 即 可 以 加 速 无 碰撞 引力 N 体 数值 模拟 ， 验 证 了 深度 学 习 方 法 在 
无 碰撞 引力 N 体 数值 模拟 中 的 可 行 性 ,为 将 来 实际 应 用 大 规模 无 碰撞 引力 N 体 数值 模拟 打下 基础 。 


7 ”未 来 与 展望 


未 来 工作 主要 有 三 个 方面 。 第 一 是 拓展 解 Poisson 方 程 由 二 维 转 到 三 维 ( 只 用 简单 将 现 有 神 
经 网 络 模型 中 的 二 维 卷 积 改 为 三 维 卷 积 即 可 ) 。 第 二 ， 加 入 和 迭代 求解 过 程 ， 实 现时 变 的 模拟 。 
第 三 是 将 模型 嵌入 到 无 碰撞 引力 N 体 数值 模拟 的 PWM-Tree 方 法 中 实际 应 用 。 
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Abstract: In this paper, a Deep Neural Network is proposed to replace the Fast Fourier 
Transform method to solve the potential energy in the PM-tree method of the collisionless 
gravitational N-body numerical simulation, so as to improve the efficiency of the PM-tree method and 
verify the feasibility of the deep learning method to accelerate the collisionless gravitational N-body 
numerical simulation. Collisionless gravitational N-body numerical simulations are important for the 
study of galaxies, dark matter halos, and the formation and evolution of the large-scale structure of the 
universe. The traditional collisionless gravitational N-body numerical simulation method is very 
time-consuming for large-scale problems, among which the main time-consuming part of the 
commonly used PM-tree method is solving the potential energy (solving Poisson equation). In this 
paper, we propose to use deep neural networks instead of traditional methods to accelerate the solving 
of Poisson equation, adjust and train and test the model structure of deep neural network for many 
times, and finally select the overall structure of Encoder-Decoder supplemented with the local 
structure of residual network. We verify that the computational time complexity of deep neural 
network to solve Poisson equation is O(N). Tested on the same data, the deep neural network is faster 
than the fast Fourier transform method solution and the finite difference method solution. At the same 
sampling rate, the accuracy of deep neural network is better than that of the fast Fourier transform 
method. And it is extensible. Therefore, in the collisionless gravitational N-body numerical simulation, 
the Deep Neural Network can improve the velocity of solving the potential energy in the PM-Tree 
method, so as to effectively improve the overall simulation speed. 

Key words: Poisson equation; Gravitational N-body Numerical simulation; Deep 
Neural Network; 
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